بازشناسی عبارات ریاضی با استفاده از شبکه اتصالات مجازی کاراکترها جهت افزایش نرخ بازشناسی در متون چاپی

thesis
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر
  • author زهرا حاجی حسنی
  • adviser محمد رحمتی
  • Number of pages: First 15 pages
  • publication year 1387
abstract

بازشناسی عبارات ریاضی یکی از مسایل مهم در تبدیل اسناد علمی و مهندسی به قالب الکترونیکی می باشد و به عبارت دیگر هدف از تحقیقات در این زمینه، تبدیل تصویر یک عبارت ریاضی به معادل متنی آن می باشد. این مسأله به طور کلی شامل سه بخش اصلی می باشد: 1- استخراج عبارات ریاضی از اسناد 2- شناسایی نمادهای موجود در عبارت. 3- بررسی ساختاری عبارت و تبدیل به شکل متنی. در این پایان نامه به هر یک از مراحل فوق در بازشناسی عبارات ریاضی چاپی پرداخته شده است. به این ترتیب که ابتدا با دریافت تصویر یک سند چاپی شامل عبارات ریاضی و متن عادی، عبارات ریاضی از آن استخراج می شوند. در این پایان نامه استخراج عبارات ریاضی که جدا از متن اصلی هستند، مورد نظر است. در این مرحله، از روش استخراج بلوک ها و سپس بازشناسی نوع بلوک ها با استفاده از ویژگی های محلی و سراسری بلوک ها استفاده شده است. در مرحله ی بازشناسی نماد از یک روش ترکیبی مبتنی بر دسته بندی سلسله مراتبی و تطابق الگو استفاده شده است. در مرحله ی بازشناسی ساختار از یک روش جدید مبتنی بر گراف برای بازشناسی عبارات ریاضی تک خطی استفاده شده است. در این روش ابتدا نماد آغازین عبارت و سپس نمادهای تشکیل دهنده ی خط اصلی، در عبارت شناسایی می شوند. سپس با توجه به موقعیت های مکانی نمادها، شبکه ای تشکیل می گردد که، گراف اتصالات مجازی نمادها نامیده شده است. خروجی مرحله ی بازشناسی ساختار عبارت tex معادل عبارت ریاضی است که در قالب متن ارایه می شود. پس پردازش هایی نیز برای مقابله با خطاها و افزایش نرخ بازشناسی ارایه شده است. روش های فوق بر روی یک مجموعه ی شامل 86 صفحه از تصاویر اسناد که از مجلات ieee استخراج شدند مورد آزمایش قرار گرفتند. نرخ بازشناسی برای مرحله ی استخراج عبارات %90 حاصل گردید. از بین عبارات استخراج شده یک مجموعه ی 300تایی انتخاب شده و دو مرحله ی بازشناسی نماد و بازشناسی ساختار بر روی آنها مورد آزمایش قرار گرفت و نرخ بازشناسی، برای مرحله ی بازشناسی نمادها % 87/91 و برای مرحله ی بازشناسی ساختار %48/97 حاصل گردید. پس از اعمال روش های مقابله با خطا برای یک مجموعه ی 100 تایی از عبارات، نرخ بازشناسی مرحله ی بازشناسی نماد از %33/91 به %63/94، و نرخ بازشناسی مرحله ی بازشناسی ساختار از %63/97 به %44/98 افزایش یافت.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

بازشناسی متون چاپی فارسی

برای بازشناسی کلمات سه رویکرد مبتنی بر جداسازی، مبتنی بر بازشناسی کلمه یک الگوی واحد و رویکرد ترکیبی مطرح است . در این رساله یک سیستم برای بازشناسی متون چاپی فارسی با استفاده از رویکرد ترکیبی ارائه شده است . یک الگوریتم جدید برای جداسازی حروف در کلمات چاپی بدون توجه به نوع قلم ارائه شده است . مراحل مختلف الگوریتم شامل تعیین نوار زمینه، تصحیح آن و جداسازی حروف است . در تعیین نوار زمینه روش جدیدی...

15 صفحه اول

بازشناسی متون چاپی فارسی با استفاده از مدل پنهان مارکوف

این پایان نامه روشی برای بازشناسی متون چاپی فارسی و زبان های دارای الفبای مشابه آن مانند عربی ارائه می دهد. بازشناسی آخرین مرحله در فرآیند ocr است که در آن به وسیله ویژگی های به دست آمده از تصویر، متن موجود در آن تشخیص داده می شود. تصویر مورد استفاده، در مراحل قبل پیش پردازش شده، انواع نویزها و چرخش آن برطرف گشته، و در نهایت دودویی شده است. در این روش، نوع و اندازه قلم یا قلم های استفاده شده در...

بازشناسی متون فارسی با استفاده از مدل زبانی n-gram و پالایش گرامری

Abstract Text recognition has been one of the growing research topics in recent years. Many of these researches have focused on recognition of letters and sub-words as a basis for identifying larger text structures such as words, phrases and sentences. This thesis presents a new method in which the recognized sub-words are combined in order to provide meaningful words and sentences in Farsi tex...

full text

بازشناسی متون چاپی با بهره گیری از کدگذاری شکل و اطلاعات معنایی زمینه

بازشناسی متون چاپی، از جمله زمینه های پرکاربرد بازشناسی الگو است. تاکنون تحقیقات متعددی در زمینه ی بازشناسی متون چاپی فارسی و عربی صورت گرفته است اما این تحقیقات، غالبا با محدودیت های فراوانی به ویژه در حوزه ی عملیاتی شدن، همراه بوده اند. کلیه ی تحقیقات انجام شده در این حوزه را می توان در قالب سه رویکرد مبتنی بر جداسازی حروف، رویکرد مبتنی بر بازشناسی شکل کلی زیرکلمات و رویکرد ترکیبی، تقسیم بندی...

15 صفحه اول

استخراج ویژگی‌ها جهت بازشناسی اشیا با الهام از بینایی انسان

در این مقاله سعی شده است تا با الگو برداری از سامانه‌ی بینایی انسان، یک روش مقاوم و تکرارپذیر برای بازشناسی اشیا ارائه شود. یکی از معروف­ترین مدل­های ارائه شده مبتنی بر بینایی انسان، مدل HMAX می­باشد که عمل‌کرد مناسبی در بازشناسی اشیا از خود نشان داده است. اما تفاوت­هایی نیز بین این مدل و بینایی انسان وجود دارد، به طوری که رویه‌ی مغز به طور کامل مدل نشده است. از جمله نواقص این مدل می­توان به تک...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی کامپیوتر

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023